home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / dev / www_talk.930 / 000476_connolly@pixel.convex.com _Thu Dec 10 17:52:06 1992.msg < prev    next >
Internet Message Format  |  1994-01-24  |  3KB

  1. Return-Path: <connolly@pixel.convex.com>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA05767; Thu, 10 Dec 92 17:52:06 MET
  4. Received: by dxmint.cern.ch (5.65/DEC-Ultrix/4.3)
  5.     id AA02503; Thu, 10 Dec 1992 18:05:32 +0100
  6. Received: from pixel.convex.com by convex.convex.com (5.64/1.35)
  7.     id AA13092; Thu, 10 Dec 92 11:05:26 -0600
  8. Received: from localhost by pixel.convex.com (5.64/1.28)
  9.     id AA23223; Thu, 10 Dec 92 11:05:24 -0600
  10. Message-Id: <9212101705.AA23223@pixel.convex.com>
  11. To: www-talk@nxoc01.cern.ch
  12. Subject: <, >, and & characters in HTML
  13. Date: Thu, 10 Dec 92 11:05:24 CST
  14. From: Dan Connolly <connolly@pixel.convex.com>
  15.  
  16.  
  17. I'm trying to write libHTML so that applications
  18. can just deal with C style character strings, and
  19. the library does all the SGML details.
  20.  
  21. The use of < and & to represent < and & never
  22. seemed to fit cleanly into the SGML view of things.
  23. So I posted to comp.text.sgml.
  24.  
  25. I think I'm a lot clearer on the matter now. The
  26. < and > entities are meant to be used in typesetting
  27. mathematics, where a less-than symbol is not necessarily
  28. the same thing as a '<' character.
  29.  
  30. There's a mechanism for referencing characters in the
  31. document character set in such a way that they will
  32. not be treated as markup: numeric character references.
  33.  
  34. I'd like to get rid of the <, >, and & entities
  35. from the HTML DTD. Granted, there will be a transition
  36. period while providers adjust, but I think it will make
  37. the spec cleaner.
  38.  
  39. Anyway, here's what the experts had to say...
  40.  
  41. [edited...]
  42.  
  43. Newsgroups: comp.text.sgml
  44. From: Erik Naggum <SGML@ifi.uio.no>
  45. Reply-To: Erik Naggum <enag@ifi.uio.no>
  46. Message-ID: <19921210.008@erik.naggum.no>
  47. Date: 10 Dec 1992 07:36:57 +0100
  48. References: <1992Dec10.020628.4884@news.eng.convex.com>
  49. Subject: Re: hiding <, >, and &
  50. Lines: 111
  51.  
  52. [Dan Connolly]
  53. :
  54. |   There is a lot of need for a routine represents an arbitrary string
  55. |   of characters as SGML data -- a routine that hides <tags> etc. from
  56. |   the parser.
  57.  
  58. The simplest would be to use character references for the characters
  59. that you need to quote.  See 9.5 Character Reference, [357:10-13].
  60.  
  61. ...
  62.  
  63. The way I see it, this is a completely failsafe technique.
  64.  
  65. |   [It does bring up the question of representing " and ' characters in
  66. |   attribute value literals. Hmm.. another situation I think I'll
  67. |   just avoid.]
  68.  
  69. What's wrong with "'", '"', """, and '''?
  70.  
  71. ...
  72.  
  73. </Erik>
  74. --
  75. Erik Naggum                 ISO  8879 SGML                    +47 295 0313
  76.                             ISO 10744 HyTime
  77. <erik@naggum.no>            ISO  9899 C                 Memento, terrigena
  78. <enag@ifi.uio.no>           ISO 10646 UCS             Memento, vita brevis
  79.  
  80.